其他
TPU演进十年:Google的十大经验教训
2017年,David Patterson加入Google TPU团队,2018年3月,他与John Hennessy共同获得图灵奖,2008年获ACM/IEEE Eckert-Mauchly 奖(被誉为计算机体系结构最高奖),2000年获得冯·诺依曼奖章。
本文是他近期在加州大学伯克利分校的演讲,他分享了Google TPU近十年的发展历程以及心得体会,并阐述了提升机器学习硬件能效对碳足迹的影响。OneFlow社区对此进行了编译。
1 一场由TPU引发的“地震”
2 十年演进,十大教训
体积只大了不到10%;
矩阵乘法单元(MXU)的数量翻倍,因此峰值性能也翻倍;
时钟频率加快了30%,进一步加快计算速度;
内存带宽扩大了30%;
容量翻倍,可使多种应用更加方便;
芯片间带宽扩大30%;
可连接的节点数是之前的4倍。
3 提升机器学习能效,减少碳足迹
OneFlow的大模型分片保存和加载策略 Jeff Dean:机器学习在硬件设计中的潜力 深挖Cerebras:世界上最大AI芯片的架构设计 OneEmbedding:单卡训练TB级推荐模型不是梦 大模型训练难?效率超群、易用的“李白”模型库来了